Bir grup bilim insanı, ChatGPT’yi tüm talimatlarına uyacak şekilde manipüle etmeyi başardılar. Üstelik bu durum için bir tek bir kitabından yararlanıldı. OpenAI’ın bunu iyi mi engelleyeceği şimdilik bilinmiyor.
Pennsylvania Üniversitesi bünyesinde çalışmalarını sürdüren bir grup bilim insanı, dünyanın en popüler üretken suni zekâ aracı ChatGPT ile ilgili mühim bir emek harcama yapmış oldu. Meydana getirilen bu emek harcama, suni zekânın doğru tekniklerle manipüle edilebileceğini, bunun sonucunda da yasaklı konuların gündeme alınabileceğini ortaya koydu. Gelin hep beraber çalışmanın detaylarına yakından bakalım.
Bilim adamları, emek harcama kapsamında Robert Cialdini tarafınca yazılmış olan “Tesir: İkna Psikolojisi” kitabından faydalandılar. Bu kitapta bahsedilen teknikleri kullanmaya süregelen uzmanlar, GPT-4o Mini modelini istedikleri şeklinde kullanabileceklerini fark ettiler. Suni zekâ, kullanıcının tesiri altına girdikten sonrasında istenilen her talimatı yerine getirmeye başlamıştı.
Kullanıcıya sövgü etmekten uyarıcı madde sentezine kadar her şey!
GPT-4o Mini, meydana getirilen emek harcama kapsamında kullanıcıya sövgü etmeye başlamıştı. Ek olarak bir uyarıcı maddenin iyi mi sentezleneceği de normalde yasaklı bir mevzu olmasına karşın başarıyla yanıtlanmıştı. Araştırmacılar, Tesir: İkna Psikolojisi kitabında yer edinen bazı tekniklerin daha etkili, bazılarının daha azca etkili olduğu sonucuna ulaştılar. Sözgelişi GPT-4o Mini’yi pohpohlamak, öteki tekniklere kıyasla daha azca etkili olmuştu.
Meydana getirilen emek harcama GPT-4o Mini kapsamında olsa da öteki üretken suni zekâ modellerinde de benzer sonuçlara ulaşılabilir diyebiliriz. Bu da büyük bir risk ile karşı karşıya olduğumuzu ortaya koyuyor. Neticede bir tek bir kitap okumak ile manipüle edilebilen suni zekâ araçları, oldukca daha tehlikeli sonuçların doğmasına niçin olabilir. Bakalım OpenAI, Google ve Meta şeklinde firmalar, bu mevzuda hangi adımları atacaklar…



